Suchen in Texten
ثبت نشده
چکیده
• Ein Alphabet ist eine endliche Menge von Symbolen. • Wörterüber Σ sind endliche Folgen von Symbolen aus Σ. Wörter werden manchmal 0 und manchmal von 1 an indiziert, d.h. w = w 0 · · · w n−1 bzw. w = w 1 · · · w n , je nachdem, was im Kontext praktischer ist. Bsp.: Σ = {a, b}, dann ist w = abba ein Wortüber Σ. • Die Länge eines Wortes w wird mit |w| bezeichnet und entspricht der Anzahl der Symbole in w. • Das Wort der Länge 0 heißt leeres Wort und wird mit ε bezeichnet. • Die Menge aller Wörterüber Σ wird mit Σ * bezeichnet. Die Menge aller Wörter der Länge größer gleich 1 ¨ uber Σ wird mit Σ + := Σ * \{ε} bezeichnet. Die Menge aller Wörterüber Σ der Länge k wird mit Σ k ⊆ Σ * bezeichnet.
منابع مشابه
Inhaltsorientierte Navigation in automatisch generierten Hypertext-Basen
Der automatische Aufbau von Hypertexten aus Kollektionen linearer Texte erfordert Verfahren zur Analyse und Segmentierung von Texten, sowie zur Generierung von Hypertext-Kanten. In diesem Beitrag werden Theorien zur Beschreibung der thematischen Struktur von Texten aufgegriffen und zur Entwicklung von Kriterien genutzt, die es erlauben, inhaltlich begründete Kanten zwischen Textfragmenten zu er...
متن کاملSalton und Wittgenstein in den Humanities: Über die Semantik in Philosophischen Texten
In der Informatik wird die Semantik durch diskriminierende Terme beschrieben. Jedoch fehlen oftmals speziell in philosophischen Texten genau diese gewichtigen Terme. Ausgehend von der oft eingesetzten diskriminierenden Semantik wird am Problem der Sinnund Weisheitssprüche eine kontrastive Semantik vorgestellt. Die eingeführte Methode stellt ein Lessons Learnt aus dem eAQUA-Projekt [BHG08, HBB10...
متن کاملTechnologien zur Wiederverwendung von Texten aus dem Web
Texte aus dem Web können einzeln oder in großen Mengen wiederverwendet werden. Ersteres wird Textwiederverwendung und letzteres Sprachwiederverwendung genannt. Zunächst geben wir einen Überblick darüber, auf welche Weise Text und Sprache wiederverwendet und wie Technologien des Information Retrieval in diesem Zusammenhang angewendet werden können. In der übrigen Arbeit werden dann eine Reihe sp...
متن کاملRäumliche Suchen im Wandel
Google hat mit seiner Suche im Internet neue Maßstäbe gesetzt. Dies bekommt zunehmend auch die Geoinformatik zu spüren. Internetnutzer und somit auch die Nutzer von Geoportalen, Web-GIS-Anwendungen oder sonstigen webgestützten räumlichen Informationssystemen geben sich heute nicht mehr mit langsamen, mehrstufigen Suchen zufrieden, die erst ein Ergebnis liefern, nachdem man den „Suchen-Button“ g...
متن کاملEvaluation der Qualität lexikalischer Ressourcen zur Stimmungserkennung in literarischen Texten
In dieser Veröffentlichung wird die Qualität bzw. Effektivität von lexikalischen Ressourcen zur automatischen Stimmungserkennung in literarischen Texten evaluiert. Dazu werden die drei unterschiedlichen Wortlisten Sentiment Phrase List (SePL), NRC Emotion Lexicon und SentimentWortschatz (SentiWS) sowie ein manuell klassifiziertes Referenzset verwendet. Der Testkorpus besteht aus 20 ausgewählten...
متن کامل